AI资讯新闻榜单内容搜索-Gemma 4

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Gemma 4
一张4090就能爆改!面壁智能MiniCPM-V 4.6开源,1B多模态卷出新高度

一张4090就能爆改!面壁智能MiniCPM-V 4.6开源,1B多模态卷出新高度

一张4090就能爆改!面壁智能MiniCPM-V 4.6开源,1B多模态卷出新高度

面壁智能正式发布并开源了 MiniCPM-V 系列新一代基础模型——MiniCPM-V 4.6。这款模型的整体参数规模仅约 1B(1.3B),是该系列有史以来参数规模最小的一款。但在多模态综合能力上,它却成功超越了被视为标杆的阿里 Qwen3.5-0.8B 和谷歌 Gemma 4 E2B-it,做到了「尺寸更小、效率更高、性能更好」。

来自主题: AI资讯
8534 点击    2026-05-13 11:57
只要24GB 内存,能在本地 Mac上跑无限制的Gemma 4 31B了

只要24GB 内存,能在本地 Mac上跑无限制的Gemma 4 31B了

只要24GB 内存,能在本地 Mac上跑无限制的Gemma 4 31B了

有个31B参数的大模型,正常需要80GB显存才能跑。但现在,24GB显存就能跑满血版。这个版本叫Gemma-4-31B-JANG_4M-CRACK——"CRACK"这个词不要理解歪了,它本质是量化压缩加上对齐微调之后的部署版本,不是什么黑客攻击,就是工程优化。24GB,MacBook Pro,直接跑。苹果用户优先优化,MLX原生支持,月下载13000次。

来自主题: AI资讯
9019 点击    2026-05-10 11:39
不改模型、不降质量,谷歌让Gemma 4快了3倍:本地跑大模型彻底变天

不改模型、不降质量,谷歌让Gemma 4快了3倍:本地跑大模型彻底变天

不改模型、不降质量,谷歌让Gemma 4快了3倍:本地跑大模型彻底变天

谷歌刚刚给Gemma 4家族更新了一项关键能力:Multi-Token Prediction(MTP)推测解码架构,推理速度最高提升3倍,输出质量不变。

来自主题: AI资讯
9099 点击    2026-05-06 14:56
iPhone本地跑Gemma 4火了,0 token时代还有多远?

iPhone本地跑Gemma 4火了,0 token时代还有多远?

iPhone本地跑Gemma 4火了,0 token时代还有多远?

一个 X 用户的帖子被围观数十万次。他在帖子里放了一个视频,讲述自己如何在 iPhone 上本地运行 Gemma 4,包括处理图片、音频、控制手电筒开关。他表示,Gemma 4 速度快得惊人,感觉像魔法一样。

来自主题: AI资讯
8875 点击    2026-04-06 13:53
谷歌Gemma 4深夜突降,31B爆杀20倍巨头!手机跑全血「龙虾」

谷歌Gemma 4深夜突降,31B爆杀20倍巨头!手机跑全血「龙虾」

谷歌Gemma 4深夜突降,31B爆杀20倍巨头!手机跑全血「龙虾」

谷歌深夜掏家底!Gemma 4全系开源,仅用31B越级斩杀20倍体量巨头。数学能力暴涨68%,硬生生把前代打成计量单位,开源界迎来终极大洗牌!

来自主题: AI资讯
9703 点击    2026-04-03 14:07
谷歌重磅开源Gemma 4!手机离线跑 Agent、还降内存,Qwen 被拉进正面对决

谷歌重磅开源Gemma 4!手机离线跑 Agent、还降内存,Qwen 被拉进正面对决

谷歌重磅开源Gemma 4!手机离线跑 Agent、还降内存,Qwen 被拉进正面对决

刚刚,谷歌正式发布 Gemma 4,称“这是其迄今为止最智能的开放模型系列”。该系列面向复杂推理与智能体工作流设计,采用商业许可的 Apache 2.0 许可证开源。Gemma 4 提供四种规格:Effective 2B(E2B)、Effective 4B(E4B)、26B 混合专家模型(MoE)和 31B 稠密模型(Dense)。

来自主题: AI资讯
9438 点击    2026-04-03 01:35